Medias de clave-valor: Transformers con memoria comprimida recurrente por bloques expandible Descubre la memoria comprimida recurrente por bloques expandible en Transformers, optimizando eficiencia y escalabilidad para secuencias largas. 2026-05-14 · 3 min